查看原文
其他

真实世界离我们有多远?

2016-09-10 大话精神

真实世界研究(RWS,real-world study)是近年来非常火热的一个概念。其实早在1999年,国外就开始搞真实世界研究了,这就是著名的GRACE研究。

GRACE是由美国马萨诸塞那大学医学院发起的急性冠脉事件全球注册研究(global registry of acute coronary events)。这是一项关于住院急性冠状动脉综合征(ACS)患者的连续性资料登记调查。这一研究中没有RCT(随机对照试验)研究严格的纳入和排除标准,也不会人为的控制变量,而是真实的记录不同地区、不同等级的医院在实际临床中如何处理ACS以及疗效。该研究历时十余年,选入了来自全球30个国家的247家医院收治的102341例ACS患者,具有较好的代表性和说服力,能够反应ACS的全球治疗现状。

RCT搞了这么多年,其在医学研究中的重要作用毋庸置疑,那么小字辈的RWS和老大哥的RCT有何异同呢?


一、效力与效果

如果说RCT的目的是探究某药物或某疗法的“效力”如何,那么RWS则更侧重在临床上能取得什么样的“效果”。RCT通过严格的随机、对照、盲法保证试验结果真实可靠,获知该干预手段是否能够在理想条件下达到预期目标;RWS关注的是在常规临床环境中药物或疗法能否给患者带来收益。RCT的价值毋庸置疑,问题是这种严格控制条件的试验结果是否可以广泛适用。RSW更容易和临床无缝对接,但研究如何设计,如何保证严格执行是有待进一步解决的问题。

二、研究人群

通常情况下RCT有着严格的纳入和排除标准,通俗一点说,入组的病例必须是按照课本上长得,如果病情较为严重或者合并其他症状较多,都会被拒之门外。通过这样严格的控制,可以较好的评价疗效,但同时也带来了一些问题——研究人群与目标人群存在较大的差异,也就是说RCT得出的结果具有代表性和偏倚性。RWS在纳入和排除上控制的就没有这么严格,基本上来者不拒,具有较好的“真实性”。那这么看来RWS明显优于RCT啊,干嘛还搞RCT呢。RCT研究发展到今天已经是一个非常成熟的体系了,通过样本量估算可以用较少的试验数得出相对准确的结论,而RWS既然强调的是真实性好,那么如果样本量不成千上万,涉及人群不覆盖大江南北,真不好意思说自己研究的是真实世界。目前为止,RWS至少需要多少样本量尚无定论,那么就只能往多里做了。虽说RWS入组标准宽松,但收集数目如此之多的病历也是一个大工程。

三、干预情况

RCT强调的是标准化的治疗,为保证试验结果尽可能准确,会采用各种手段(诸如双盲双模拟)严格控制。吃什么药,吃哪个厂家的,吃哪种剂型甚至什么时候吃都有严格的要求,追求的就是更少的变量和更高的信度。RWS强调的是真实的治疗,即根据患者的实际情况和意愿选择治疗方案。通常情况下,RWS只以是否采用了“某一种疗法”作为区分试验组和对照组的依据(一般来说对照组采用的是经RCT验证有效的疗法)。比如想搞一个关于心境稳定剂的RWS,就可以只把“是否使用了丙戊酸”作为分组依据,至于用的哪种丙戊酸,用没用锂盐,还用了哪些药物都不是入组和分组的主要依据。

四、结果评价

由于RCT研究受制于时间,评价指标往往以症状的转归和体征的改变为主。RSW临床观察和后期随访的时间都较长,除了临床指标的改善,还包括病死率、复发率、伤残程度、生活质量等更具有现实意义的评价指标。抑郁症是一种复发率较高的精神科疾病,严重影响患者生活质量,造成较大的社会负担。如果搞一个抑郁症的RWS,那么只打一下HAM-D或者MARDS量表是远远不够的。根据抑郁症的特点,复发情况、认知损害、生活质量、总体印象、总体功能都应被纳入评价指标中,甚至失业率、收入情况、治疗支出、感情生活、死亡率等都可以是评价标准。

五、数据分析

RCT搞了这么多年,数据的收集和分析大家都轻车熟路。数据收上来,统计人员利用统计学软件(SPSS、SAS等)一处理,结果很快就出来了,有无意义一眼可见。RWS的数据分析基本也是这么一个套路,稍微校正一下就好。不过RWS样本量更大,变量更多,就意味着可以挖掘的数据极多,工作量自然也是成倍的增长。当然了,成倍增长的还有成本,而且由于条件控制不严格,得出无意义结论的概率也高于RCT。


上面说了这么多,RWS在国内最受谁欢迎呢?在中国知网粗略检索后发现,最喜欢搞RWS的两个学科是中医和心血管(遗憾的是国内精神科的RWS几乎没有)。一开始我们就提到了RWS是从心血管发家的,所以国内关于心血管方面的RWS多一点也不意外。那为啥“老中医”这么热衷于RWS呢?中医讲究“整体观念”“辨证论治”。简单的理解就是中医很难找出两张一样的处方,中医的体系与RCT格格不入。所以在RWS崭露头角后,中医立马就投入其怀抱,中医的“整体观念”“辨证论治”只有在真实世界中才能得到充分的施展。

精神科是不是和中医有点像呢?RCT这条路走起来并不顺。来精神科就诊的患者多少都有点认知方面的问题,治疗依从度较差,想靠一种疗法解决问题看起来不太靠谱。而且处于发作期的精神疾病患者症状难以控制,多药联用的情况较为常见,凑齐一组处方完全相同的患者真的有点难。精神科药物起效较慢,组合出一套完美的治疗方案需要不断调整。加之精神科药物副反应较多,如果不及时调整,患者停药和治疗失败的概率相对较高。如果再考虑到中国患者基因多态性的问题,在精神科设计一个临床适用性强的RCT真的很难(不难的早让药商做了)。既然搞RCT有这么多困难,搞一搞RWS如何?我们先来看看国外是怎么做的。

《Effectiveness of injectable risperidone long-acting therapy for schizophrenia: data from the US, Spain, Australia, and Belgium》是2011年发表于《Ann Gen Psychiatry》杂志的一篇文章(doi: 10.1186/1744-859X-10-10)。这是一项美国、西班牙、澳大利亚、比利时等多国参与的利培酮长效针剂(risperidone long-acting therapy,RLAT)真实世界研究(n=3069)。

文章一共纳入了两项研究,分别是的SOURCE和 eSTAR 。虽然eSRAR有17个国家参与,但因为只有西班牙、澳大利亚和比利时完成了24个月的治疗,所以剩下的数据未被纳入。可见真实世界研究虽然对入组标准限制不严格,但不代表谁都可以入组。此外怀孕期和哺乳期妇女以及不配合治疗的患者也被排除在外。

尽管RLAT的推荐剂量是每两周注射25mg,但实际用量是医生自行判断的(大部分医生选用了推荐剂量),这是RWS和RCT显著不同的地方,在严格的RCT中,操作人员可能连自己注射的是药物还是安慰剂都不知道,更别提调整剂量了。此外,停药、换药、联合用药在这一研究中都是医生说了算。

CGI-S(临床总体印象严重度)量表和GAF(功能大体评定)量表被用于效果评价,入组前打一次量表,然后每3个月打一次,一直到24个月结束。结果如下:



得出的结论也没有多么惊天动地:RLAT的有效性贯穿了整个治疗过程。利培酮的耐受性一直是关注的焦点,所以要分析一下。发现美国停药率最高,只有39.3%的患者坚持使用两年。西班牙停药率最低,62.7%的患者在两年内都不曾停止RLAT。导致这一差异的原因可能是治疗方法,也可能是家庭支持度。值得关注的是,在西班牙RLAT是免费的!同时美国和西班牙患者的GAF评分较高,说明这两个国家患者功能恢复较好。作者认为这与两国的医疗体系有关,这两个国家的患者主要经门诊治疗,而非住院治疗,住院与否很有可能是影响功能恢复的因素。这些结论是很难从RCT中得出的。最后,作者还理性的评论了RCT和RWS优劣,这些前面基本都提到过,不再赘述了。

看完了国外做的RWS,你是不是也感觉没啥高大上的东西。确实,RWS本来就是从RCT中来的,房子还是那间房子,只不过换了一种装修风格,封闭式私宅变成了开放式庭院。那么如果想在精神科搞RWS难吗?说简单也简单,说难也难。简单指的是RWS并没有什么玩不转的高科技,难指的是RWS需要科学的数据收集体系。

在真实世界的大数据收集困难重重,虽然我国的大部分医院都已经上了HIS系统,但医院的系统互相之间并不兼容;精神疾病患者的配合度低;精神疾病患者总是希望自己的隐私能被较好的保护,知道的人越少越好;精神科常用量表较多,一般来说临床医生根据患者的实际情况选择量表,用的不一样就没法搞大数据;对于自己取得的临床数据,想必很多人也不愿意白白贡献出来吧?

所以说,对于精神科的RWS研究,每一个临床医生都应该有参与的意识以及对结果的分析、解读、运用能力。但谁牵头来搞,用什么样的标准搞确实是个问题。万能的读者们,你们觉得呢?

推荐阅读

司天梅教授:抑郁不仅仅是情感障碍

再聊一聊G-CSF与氯氮平诱导的粒细胞缺乏

一个步骤解决氯氮平诱发的粒细胞缺乏症

大话精神编译,转载请注明出处。投稿请联系:dahuajingshen@126.com

  

 长按,识别二维码,关注公众号

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存